Fouille de collections de documents en vue d'une caractérisation thématique de connaissances textuelles

نویسندگان

  • Abdenour Mokrane
  • Gérard Dray
  • Pascal Poncelet
چکیده

Résumé. De nos jours, les entreprises, organismes ou individus se trouvent submergés par la quantité d'information et de documents disponibles. Les utilisateurs ne sont plus capables d’analyser ou d’appréhender ces informations dans leur globalité. Dans ce contexte, il devient indispensable de proposer de nouvelles méthodes pour extraire et caractériser de manière automatique les informations contenues dans les bases documentaires. Nous proposons dans cet article l’approche IC-Doc de caractérisation automatique et thématique du contenu de collections de documents textuels. IC-Doc est basée sur une méthode originale d’extraction et de classification de connaissances textuelles prenant en considération les co-occurrences contextuelles et le partage de contextes entre les différents termes représentatifs du contenu. IC-Doc permet ainsi une extraction automatique de KDMs (Knowledge Dynamic Maps) sur les contenus des bases documentaires. Ces KDMs permettent de guider et d’aider les utilisateurs dans leurs tâches de consultations documentaires. Ce papier présente également une expérimentation de notre approche sur des collections de documents textuels.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un aperçu de la fouille visuelle de données

Résumé. Nous présentons dans cet article un aperçu de la fouille visuelle de données. Pour commencer, nous situons ce domaine par rapport à d’autres approches et nous en rappelons les principes fondateurs. Ensuite, nous montrons qu’il existe de nombreux points de vue pour aborder les travaux en fouille visuelle de données : les données ou connaissances à visualiser, la tâche à accomplir, la rep...

متن کامل

Un système de gestion de documents hétérogènes dédiés au patrimoine archéologique et gérés sur le réseau Internet. Le cas de l'épave étrusque du Grand Ribaud

HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt età la diffusion de documents scientifiques de niveau r...

متن کامل

Génération de documents multimédia adaptatifs dans une perspective analytique

RÉSUMÉ. Le volume de documents disponible sur l'Internet rend difficile les tâches de recherche d'informations. Parallèlement, des efforts vers la personnalisation de l'Internet permettent l'adaptation des pages web à l'utilisateur. Pour ce faire, les travaux s'orientent vers les concepts des systèmes d'informations adaptatifs et de la génération de résumés de collections de pages. La plupart d...

متن کامل

Vers une Cartographie des Connaissances Guidée par la Fouille des Données

Résumé. Ce papier présente une nouvelle approche de cartographie des connaissances stratégique/métiers guidée par apprentissage automatique en vue de définir la stratégie de gestion des connaissances à engager. La démarche que nous avons expérimentée s’appuie sur une nouvelle méthode cellulaire d’extraction de règles à partir des données nommée CASI (Cellular Automaton for Symbolic Induction). ...

متن کامل

Une ontologie pour l'acquisition et l'exploitation des connaissances en conception inventive

Résumé. L'acquisition des connaissances en vue de résoudre des problèmes concernant l'évolution des artefacts, comme elle se doit d’être pratiquée en conception inventive, a des caractéristiques spécifiques. Elle nécessite la sélection de certaines des connaissances qui peuvent induire des évolutions, elle amène à reformuler le problème initial afin de construire un modèle abstrait de l'artefac...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005